是 RNN 的變種,是用來解決梯度消失的問題,也能夠將長序列資料處理的更好
LSTMs 的核心概念是使用閘門來調控記憶,來改善長期記憶
( RNN 短)
圖源: Understanding LSTM Networks -- colah's blog
( RNN 長)
圖源: Understanding LSTM Networks -- colah's blog
而LSTM 利用遺忘閘和輸入閘成功解決了長期依賴問題
LSTMs 包含多個相互連接的單元,每個單元有四個核心組件:
https://colah.github.io/posts/2015-08-Understanding-LSTMs/